طبقه بندی برخط داده های جریانی غیرایستان و نامتعادل با رویکرد وزن دهی
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی
- author عادل قاضی خانی
- adviser رضا منصفی هادی صدوقی یزدی
- publication year 1392
abstract
طبقه بندی داده های جریانی غیرایستان یکی از شاخه های مهم علم تشخیص الگو و یادگیری ماشین است که به طور روز افزون مورد توجه قرار گرفته است. دلیل این موضوع کاربردهای فراوان جدیدی از قبیل کارت های اعتباری، آب و هوا، شبکه های حس گر بی سیم، داده های وب و غیره است. در طبقه بندی داده های جریانی چالش اساسی تغییر مفهوم (غیرایستان بودن) است، که در آن تابع توزیع زیرین توصیف کننده داده ها به مرور زمان تغییر می کند. یکی از چالش های دیگری که در طبقه بندی داده های جریانی وجود دارد کلاس های نامتعادل است. کلاس های نامتعادل چالشی برای بیش تر طبقه بندهای باناظر است که در آن تعداد نمونه ها در کلاس های مختلف با یکدیگر اختلاف فاحش دارند. اغلب الگوریتم هایی که تاکنون برای طبقه بندی داده های جریانی غیرایستان و نامتعادل ارائه شده اند رویکرد دسته ای دارند. از این رو، برخلاف مطالعات قبلی، در این پایان نامه طبقه بندهایی برخط برای طبقه بندی داده های جریانی غیرایستان و نامتعادل پیشنهاد شده است. در این راستا، الگوریتم هایی در سه دسته اساسی مبتنی بر فیلترهای وفقی، پرسپترون و ترکیب برخط طبقه بندها ارائه شده است. در الگوریتم های مبتنی بر فیلتر وفقی و پرسپترون رویکرد اساسی وزن دهی به خطا و در الگوریتم های مبتنی بر ترکیب برخط طبقه بندها رویکرد اساسی وزن دهی به رأی طبقه بندهای پایه است. در الگوریتم های مبتنی بر فیلترهای وفقی از تئوری ردیابی و تئوری کالمن و در الگوریتم های مبتنی بر پرسپترون و ترکیب برخط طبقه بندها از مدل کران خطا برای تحلیل الگوریتم ها استفاده شده است. برای ارزیابی الگوریتم ها از مجموعه داده های متنوع واقعی و مصنوعی مورد استفاده در تحقیقات پیشین، بهره برده شده است. در ارزیابی الگوریتم ها از معیارهای میانگین هندسی، نرخ صحت مثبت و منفی (tpr,tnr)، f-measure و هم چنین مرتبه زمانی و مکانی استفاده شده است. برای تأیید نتایج آزمایش ها از آزمون های تمایز آماری anova و hsd استفاده شده است. نتایج آزمون های تمایز آماری نشان دهنده برتری الگوریتم های پیشنهادی مبتنی بر فیلترهای وفقی نسبت به rlsp,rbsop,lbsop,rbp,lbp، الگوریتم های پیشنهادی مبتنی بر پرسپترون نسبت به spa,sop,lbsop,rbsop و الگوریتم های پیشنهادی مبتنی بر ترکیب برخط طبقه بندها نسبت به oe1,oe2,onb دارد.
similar resources
یک روش برای کاهش طبقه بندی داده با استفاده از تکنیک وزن دهی در svm+
svm یک الگوریتم یادگیری مرتبط به تجزیه و تحلیل داده ها و تشخیص الگوها مورد استفاده می باشد.اما مسئله مهمی که وجود دارد داده های تکراری و همچنین زمان پردازش واقعی آن بدرستی مورد محاسبه واقع نشده است. به همین دلیل ما یک روش برای کاهش طبقه بندی داده ها با استفاده از تکنیک وزن دهی در svm+ است را ارائه داده ایم. روش پیشنهادی که با درنظر گرفتن پارامترها نسبت به svm+ زمان پاسخگویی بهینه دارد.با مشاهده...
کاوش برخط الگوهای پویای زمانی در داده های جریانی
کاوش در جریان داده فرایندی است که منجر به استخراج دانش از جریانی سریع از داده های پیوسته می شود. در سالهای اخیر، به دلیل اهمیت کاربردهای آن و پیشرفت در تکنولوژی سخت افزاری بسیار مورد توجه قرار گرفته شده است. در بسیاری از زمینه های کاربردی مانند شبکه های کامپیوتری، بازارهای مالی و مبادلات ارزی، مکالمات تلفنی، کارت های اعتباری، مراکز داده و سرورها، تصاویر ویدئویی، شبکه حسگرها، رادارها، ماهواره ها...
15 صفحه اولطبقه بندی راه های شهری مبتنی بر ادغام در سطح تصمیمات داده های نوری و راداری
در این مقاله قابلیت تصاویر اسپات و سار به منظور تشخیص عارضه راه در مناطق شهری مورد بررسی قرار گرفته است. شباهت طیفی عارضه راه با سقف آسفالت ساختمان ها در مناطق شهری موجب بروز مشکلاتی در تشخیص راه مبتنی بر داده های اپتیک از جمله اسپات می گردد. از سوی دیگر، تصاویر سار با اینکه قابلیت خوبی در تشخیص راههای فرعی و باریک دارند، اما در تشخیص راه از پوشش گیاهی دچار مشکلاتی می شود. بنابراین، نتایج حاصل ...
full textدسته بندی داده های جریانی فازی با استفاده از تحلیل پوششی داده ها
در این تحقیق یک روش دسته بندی داده های غیرقطعی از نوع فازی که از جمله چالش برانگیزترین حوزه های تحلیل داده محسوب می شود، ارائه شده است. در واقع حجم بالا و پیچیدگی روش های تحلیل داده مانع از توسعه روش هایی جهت تحلیل داده های فازی می شود. با این حال در برخی حوزه های دیگر همچون برنامه ریزی ریاضی پیشرفت های چشمگیری در مدل سازی سیستم هایی که داده های فازی از آنها در اختیار است، بدست آمده است و لذا ت...
full textارائه یک سیستم طبقه بندی کننده چندگانه فازی برای ادغام داده های فراطیفی و لیدار
محدودیتهای سنجندههای مختلف سنجش از دور و ضعف آنها در شناسایی عوارض مختلف باعث شد ادغام دادههای حاصل از سنجندههای مختلف به منظور بهبود نتایج طبقه بندی مورد توجه قرار گیرد. در میان سنجندههای مختلف کنونی، در سالهای اخیر دو سنجنده فراطیفی و لیدار به منظور طبقهبندی زمین بسیار پرکاربرد بودهاند. دادههای حاصل از لیدار اطلاعات ارتفاعی مناسبی را از عوارض زمینی به ویژه عوارض دارای ارتفاع مانند سا...
full textطبقه بندی متقاضیان تسهیلات اعتباری بانکی با استفاده از داده کاوی و منطق فازی
در این پژوهش، هدف، بهره گیری از ابزارهای داده کاوی و منطق فازی برایطبقه بندی مشتریان تسهیلات اعتباری می باشد به طوریکه ابهامات و عدم قطعیت رادر خصوص طبقات مشتریان و نیز متغیرهای تاثیر گذار در رفتار آنها را پوشش دهد.روش کار بدین شکل می باشد که طبق یک فرایند استاندارد داده کاوی، داده هایمشتریان سابق بانک سامان جمع آوری و پالایش شده و سپس طبقات و متغیرهاییکه قابلیت فازی کردن داشتند، طبق نظر کارشنا...
full textMy Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023